查看原文
其他

人工智能大模型爆发,算力需求激增,人民数据算力中心建设进行时

和纳 人民数据
2024-09-16


算力需求激增,人民数据算力中心建设引起社会广泛关注。


算力概念热度持续升温。此前,一则署名为北交所上市公司董事长的微信朋友圈消息在市场上流传,信息内容显示:“我们算力服务已经上线10000张A800/A100卡,今年另有12000张H800卡在逐步上线中,超算模式算力,价格极具竞争力,欢迎试用。”


无独有偶,近期亦有消息称,因算力需求旺盛、供给紧张,某互联网巨头已暂停A100服务器出租业务。这一消息虽未得到证实,但也同样暴露了国内算力租赁市场需求量远超供应量,存在巨大缺口。有机构分析指出,行业供求矛盾升级,算力租赁行业将进入新一轮涨价周期。


大模型“炒热”算力租赁,撑起行业蓝海



算力是当代生产力,超级计算也被称为高性能计算,同时使用几十台甚至几千台服务器这样庞大的算力资源共同完成一个计算任务。


人工智能大模型的爆发让算力需求激增。由于AI大模型需要大量的计算资源进行训练和推理,而许多个人和企业无法承担购买和维护这些硬件设备的成本。因此,算力租赁提供了一个经济有效的方式来获得所需的计算资源。根据有关数据预测,2023年AI服务器(包含搭载GPU、FPGA、ASIC等)出货量近120万台,年增38.4%;占整体服务器的出货量有望从2023年近9%提升至2026年15%;同时2022—2026年AI服务器出货量年复合成长率至22%。


今年来,随着AI大模型的涌现,计算芯片依赖已从CPU转向GPU,也就意味着,GPU成为驱动AI技术发展以及应用落地的关键引擎,像大模型训练、推理也催生了大量AI算力需求。


对标GPT-3和GPT-4模型,GPT-3模型训练使用了128台英伟达A100服务器(训练34天),对应640P算力,GPT-4模型训练使用了3125台英伟达A100服务器(训练90-100天),对应15625P算力。从GPT-3至GPT-4模型参数规模增加约10倍,但用于训练的GPU数量增加了近24倍(且不考虑模型训练时间的增长)。


因此,上游AI算力资源作为重要支撑,稀缺性凸显。在此背景下,AI算力租赁需求爆发,也是在情理之中。据专业机构预测,未来每家龙头大模型厂商推理侧A100需求有望达到十万张量级,一片蓝海市场。


人民数据资产服务平台数据显示,2023年10月18日—11月17日,关于“算力租赁”的相关信息量超过8万余条,环比增加232.45%,相关信息传播声量在11月达到高峰,相关话题相继在新闻资讯、两微一端、论坛、网络媒体等多个平台被转发关注。其中,新闻资讯和两微一端及论坛成为舆论发酵的主要阵地,相关信息的传播分布占比近98.18%。网民关注“利好”“涨停”“算力”等热词。

图:截至2023年11月17日算力租赁A股指数周K线

图:截至2023年11月17日“算力租赁”有关信息渠道分布


超算架构为大模型训练提速,

我国算力业务前景可期


目前,我国算力规模整体保持高速增长,2022年达302EFlops,连续两年增速近50%;超算算力占比尚小但持续增长,2022年达3.9EFlops,连续两年增速超30%。


有关机构研报显示,以训练一次1746亿参数的GPT-3模型为例,需要算力约为3640PFlop/s-day,完成一次训练成本过亿元。


目前,地方政府是AI智算中心建设的主要规划与投资方。根据有关数据显示,全国有超过30个城市正在建设或规划智算中心,其中一些已经投入运营或即将投入运营,总规划算力达到了数十EFlops。若假设未来全国智算中心算力达到50EFlops(对应50000PFlops),对应AIDC建设规模空间为500-750亿元。

图:部分地方政府智算中心建设规划


此前,人民数据中原算力中心在河南郑州正式启动。人民数据中原算力中心由人民数据与中创算力共同建设,将以数字新基建数据中心作为重点,为地方政府提供数字新基建下的技术支持、容灾备份、产业赋能等全方位的服务,为政府和企业搭建一个集政、产、学、研为一体的新基建协同协作平台。



作者:人民数据研究院研究员 和纳


编辑:李冰(实习)

责编:王晓彤 岳禺宁



喜欢本文,请点这里



继续滑动看下一个
人民数据
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存